Domaći III
Linearna i logistička regresija
Student: Banjević Nikola (3 / 2025)
Baza podataka
Za potrebe prvog domaćeg koristićemo dio baze podataka koja sadrži informacije o nivou ekonomskog i političkog razvoja. Datoteka dodijeljena svakom studentu sadrži između 100 i 150 redova (država) i 10 kolona (varijabli). Detaljan opis varijabli nalazi se u Tabeli 1:
Tabela 1. Pregled varijabli u bazi podataka
| Varijabla | Opis | Skala |
|---|---|---|
| naziv | Ime države | Nominalna |
| razvoj | Indeks ljudskog razvoja (HDI) | Intervalna |
| rezim | Kojeg je tipa politički režim | Nominalna |
| gini | Indeks ekonomske nejednakosti (GINI) | Intervalna |
| frak | Nivo etničke frakcionalizacije | Ordinalna (kategorička) |
| vijek | Prosječno trajanje životnog vijeka | Intervalna |
| urban | Udio urbanog stanovništva u populaciji | Intervalna |
| nejed | Nivo rodne nejednakosti | Intervalna |
| oecd | Da li je država članica OECD | Ordinalna (kategorička) |
| nivodem | Nivo demokratije | Intervalna |
Zadatak
Učitati bazu podataka banjević-nikola-III.xlsx u R.
Rekodirati nedostajuće vrijednosti na svakoj varijabli.
Izračunati Pirsonovu linearnu korelaciju između rodne nejednakosti i procenta (udjela) urbane populacije. Interpretirati rezultat.
Grafički prikazati korelaciju između dvije varijable.
Kreirati linearni model (OLS) koristeći rodnu nejednakost kao zavisnu varijablu, a procent urbane populacije, prosječni životni vijek i nivo razvoja (HDI)kao nezavisne varijable.
Interpretirati rezultate.
Grafički prikazati odnos između rodne nejednakosti i prosječnog životnog vijeka.
Kreirati novi linearni model dodavanjem još dvije nezavisne varijable: nivo etničke frakcionalizacije i članstvo države u OECD.
Obrazložiti način na koji je varijabla nivo etničke frakcionalizacije uključena u analizu?
Interpretirati rezultate novog modela.
Uporediti kvalitet i rezultate prvog i drugog modela.
Kreirati logistički model na osnovu kojeg možemo izračunati uticaj prosječnog životnog vijeka, nivoa razvoja (HDI) i procenta (udjela) urbane populacije na nivo etničke frakcionalizacije.
Interpretirati rezultate.
Koji procent slučajeva je model tačno predvidio?
Kreirati logistički model na osnovu kojeg možemo izračunati vjerovatnoću članstva države u OECD-u koristeći iste nezavisne varijable kao u slučaju prvog logističkog modela.
Interpretiraj rezultate.
Koji procent slučajeva je model tačno predvidio?
Koristeći prvi logistički model izračunaj kolika je vjerovatnoća da će država etnički heterogena , sa nivoom ljudskog razvoja 0,63 , sa procentom urbane populacije 75 biti članica OECD-a. Interpretirati rezultat.
Instrukcije
Rok za predaju domaćeg zadatka je 1.6.2026. u 13.00. Radove poslati na nbatricevic.fpn@gmail.com.
Domaći zadatak dostaviti u Word formatu. Naziv fajla bi trebalo da prati format: Domaci_III_Banjević_Nikola
Fajl sa domaćim zadatkom trebalo bi da sadrži: kod, rezultat (output iz konzole) i interpretaciju.
Napomena: nepotpuni domaći zadaci neće biti pregledani.